Ex_treme's blog.

个性化召回算法协同过滤理论部分(itemcf )

2018/11/17 Share

协同过滤(collaboratice filtering)

  • 基于物品的协同过滤(Itemcf)背景,例子,公式与工业界落地时的公式升级
  • 基于用户的协同过滤(Usercf)背景,例子,公式与工业界落地时候的公式升级
  • Itemcf与Usercf优缺点分析

背景

  • 信息过载,用户实际需求不明确
  • 强依赖于用户行为

Item cf

  • 给用户推荐它之前喜欢的物品相似的物品
  • 如何衡量相似物品(基于用户行为取衡量)
  • 如何衡量喜欢(用户是否为真实点击,实际消费购买)

example

image

a d 物品是很相似的,因为用户A和D都喜欢它们,因此C卖了d之后,我们就可以推荐他买a,因为a和d是相似的。

公式

  • 根据用户行为计算出物品相似度矩阵
    image

u(i)u(i)u(j)u(j)分别表示喜欢物品ii和喜欢物品jj的用户集合,分母用作归一化处理,惩罚了热门物品(与很多用户都喜欢的物品)对相似度计算的影响;ruir_{ui}表示的是用户对物品ii的得分,例如购买、收藏、加购物车等操作量化成为具体分值,而后归一化导0~1,SijS_{ij}就是物品相似度得分,根据物品ii完成推荐,iN(u)i\in N(u)是用户作用过的物品,s(j,k)s(j,k)是与i最为相似的前k个物品,一般k取前50个。

公式升级1

理论意义:活跃用户应该被降低在相似度公式中的贡献度
image

改进后的公式中,用户对物品的贡献都变得不一样了,N(u)N(u)表示的是用户作用过的所有物品,我们发现一个用户作用过的物品越多,他对相似度的贡献就越小,这是符合常理认知的。

公式升级2

理论意义:用户在不同时间对item的操作应给予时间衰减惩罚
image

分母相对一般的cf计算公式没变,变化的分子中,item iijj行为的时间间隔越小,则其相似度越接近,行为差异越大,相似度也越小。

CATALOG
  1. 1. 协同过滤(collaboratice filtering)
  2. 2. 背景
  3. 3. Item cf
  4. 4. example
  5. 5. 公式
  6. 6. 公式升级1
  7. 7. 公式升级2